Статистичне вивчення взаємозв`язків

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Статистичне вивчення взаємозв'язків

Зміст
1. Сутність кореляційного зв'язку
2. Статистичні методи виявлення наявності кореляційного зв'язку між ознаками
3. Вимірювання ступеня тісноти кореляційного зв'язку між двома ознаками
4. Рівняння регресії і способи його розрахунку

1. Сутність кореляційного зв'язку

Вивчення дійсності показує, що кожне суспільне явище перебуває в тісному зв'язку і взаємодії з іншими явищами. Так, наприклад, рівень продуктивності праці працівників буде залежати від ступеня досконалості застосовуваного встаткування технології, організації виробництва праці і управління та інших факторів. Саме вивчення такої залежності навколишніх умов на варіацію ознаки і становить зміст теорії кореляції.
При вивченні конкретних залежностей одні ознаки виступають як фактори, що обумовлюють зміну інших ознак і називаються ознаками - факторами (факторними ознаками). Ознаки, які є результатом впливу цих факторів називаються результатами. Наприклад, продуктивність праці - результуючий ознака.
Розглядаючи залежності між ознаками, необхідно виділити перш за все дві категорії залежностей:
1) залежно функціональні;
2) залежно кореляційні.
Функціональна характеризується повною відповідністю між зміною причини і зміною результативною величини і відповідністю кожному значенню ознаки - фактора певного результативної ознаки.
У кореляційних зв'язках між зміною факторного та результативного ознак немає повної відповідності і вплив окремих факторів проявляється лише в середньому при масовому спостереженні факторів, оскільки кожному значенню факторної ознаки може відповідати розподіл значень результативної ознаки. Одночасний вплив на досліджуваний ознака великої кількості найрізноманітніших чинників призводить до того, що одному і тому ж значенню ознаки фактора буде відповідати ціле розподіл значень результативної ознаки, оскільки в кожному конкретному випадку інші факторні ознаки можуть змінювати силу і напрям свого впливу.
Порівнюючи між собою функціональні та кореляційні залежності слід взяти до уваги, що при наявність кореляційної залежності встановлюється тільки тенденція зміни результативної ознаки при зміні величини факторного ознаки.
При дослідженні кореляційних залежностей між ознаками рішенням підлягає широке коло питань, до яких слід віднести:
1. попередній аналіз властивостей сукупності одиниць;
2. встановлення фактору наявності зв'язку, визначення її напрями і форми;
3. зміна ступеня точності зв'язку між ознаками;
4. побудова регресійної моделі;
5. оцінка моделі, її економічне обгрунтування і практичне застосування.
Щоб результати кореляційного аналізу знайшли практичне застосування, повинні виконуватися певні вимоги щодо відбору об'єкта дослідження і ознак - факторів.
1. однорідність одиниць, які піддаються вивченню методами кореляційного аналізу;
2. оцінка однорідності досліджуваної сукупності за допомогою показників варіації (коефіцієнтів варіації);
3. достатнє число спостережень;
4. незалежність один від одного факторних ознак;
5. нормальний характер розподілу досліджуваних ознак;
6. кількісне вираження факторних ознак, що дає можливість скласти модель кореляційної залежності.

2. Статистичні методи виявлення наявності кореляційного зв'язку між ознаками

Для виявлення наявності або відсутності кореляційного зв'язку використовується ряд методів:
1. паралельне зіставлення рядів значень результативного і факторного ознак. При цьому значення факторної ознаки розташовують у порядку зростання, а потім простежують напрямок зміни результативного. Результативний ознака буде - Y, а факторний - Х;
2. побудова групової та кореляційної таблиць.;
3. дисперсійний аналіз.
Результативний ознака функцію позначаємо через Y, факторний ознака через Х. Наприклад, по 20 партіям деталей була встановлена ​​величина середнього часу міжопераційних перерв між двома суміжними технологічними операціями і величина середньої зайнятості робочого місця виконанням однієї операції.
Таблиця 1
№ партії деталей
Середня зайнятість робочого місця, ч
Середній час міжопераційних перерв, год
№ партії деталей
Середня зайнятість робочого місця, ч
Середній час міжопераційних перерв, год
1
0,22
1,46
11
0,26
0,69
2
0,22
1,12
12
0,30
0,80
3
0,22
1,18
13
0,30
0,61
4
0,24
0,82
14
0,30
0,95
5
0,24
1,26
15
0,30
0,73
6
0,24
0,90
16
0,32
0,50
7
0,24
1,02
17
0,32
0,37
8
0,24
1,08
18
0,32
0,47
9
0,26
0,57
19
0,32
0,32
10
0,26
1,37
20
0,32
0,36
Паралельне зіставлення дозволяє встановити, що збільшення середньої зайнятості робочого місця тягне за собою зменшення середнього часу міжопераційних перерв, хоча в окремих випадках наявність зазначеної залежності може і не убачатиметься.
Однак наявність великої кількості різних значень результативних ознак, що відповідають одному і тому ж значенню ознаки - чинника ускладнює сприйняття таких рядів, тому для встановлення факту наявності зв'язку користуються кореляційними або груповими таблицями.
У кореляційної таблиці факторний ознака Х розташовується в рядках, а результат Y у колонках таблиці. Числа розташовані на перетині рядків і стовпців показують частоту повторень даного поєднання значень Х та Y.
Побудуємо кореляційну таблицю 2, в якій Х - середня зайнятість робочого місця (факторний ознака); Y - середній час міжопераційних перерв (результативна ознака).
Середній час
межоперац.
перерв.
Середня Група
Зайнятість поY
по Х
0,32 -0,55
0,55 - 0,78
0,78 - 1,01
1,01 - 1,24
1,24 - 1,47


Середина інтервалу
0,435
0,665
0,895
1,125
1,355
0,22
0,24
0,26
0,30
0,32
5
2
2
2
2
2
2
1
1
1
3
5
3
4
5
1, 202
1,079
0,895
0,780
0,435

5
4
4
4
3
20
- Середнє значення результатів ознаки;
- Частота повторень даного варіанту значень факторного ознаки в усій сукупності;
- Частота повторень значень результатів ознаки в усій сукупності.
Для результатів ознаки необхідно визначити величину інтервалу за формулою Стреджесса
,
.
Середній час міжопераційних перерв для партії деталей мають середню зайнятість робочого місця 0,223
і т.д.
Кореляційна таблиця вже при загальному знайомстві дає можливість висунути пропозицію про наявність або відсутність зв'язку, а також виявити її напрямок.
Якщо частота в кореляційної таблиці розташована по діагоналі з лівого верхнього кута в правий нижній кут (тобто великим значенням Х відповідає більше значення Y) можна припустити про наявність прямої кореляційної залежності, якщо навпаки то зворотною. Т.ч. зменшення середніх значень результативної ознаки з збільшенням значення факторної ознаки ще раз свідчить про зворотній кореляційної залежності середнього часу міжопераційних перерв партії деталей від середньої зайнятості робочого місця. Іншим прийомом виявлення зв'язку є побудова груповий таблиці 3. Всі спостереження розбиваємо на групи в залежності від величини ознаки - фактора і по кожній групі обчислюємо середнє значення результативної ознаки.
Групи партій деталей за рівнем середньої зайнятості
Сума значень результативної ознаки в групі
Число партій деталей у групі
Середнє значення результативної ознаки в групі
0,22
3,76
3
1,253
0,24
5,08
5
1,016
0,26
2,63
3
0,877
0,30
3,09
4
0,773
0,32
2,02
5
0,404
Разом
16,58
20
0,829
Порівнявши середні значення результуючого ознаки за групами можна також зробити висновок, що зростання середньої зайнятості робочого місця тягне за собою зниження величини міжопераційних перерв, тобто можна сказати має місце зворотний кореляційний зв'язок.
Якби зв'язку між факторними і результативними ознаками не було, то всі групові середні були б приблизно однакові за величиною. Оцінка суттєвості розбіжності групових середніх лежить в основі використання методу дисперсійного аналізу для виявлення наявності та оцінки зв'язку.
Для попереднього виявлення зв'язку і розкриття її характеру застосовують графічний метод. Використовуючи дані таблиці 1 побудувати точковий графік, який називають поле кореляції.
Завдавши дані таблиці 3 і з'єднуючи послідовно відрізками прямих відповідних їм точок, одержимо емпіричну лінію зв'язку.
Якщо емпірична лінія наближається до прямої, - припускають наявність прямолінійної кореляційного зв'язку, якщо до будь-якої кривої, то це може бути пов'язано з наявністю криволінійної кореляційного зв'язку.

3. Вимірювання ступеня тісноти кореляційного зв'язку між двома ознаками

Показники тісноти зв'язку дають можливість охарактеризувати ступінь залежності варіації результативної ознаки від варіації ознаки - фактора.
Знаючи показники тісноти кореляційного зв'язку можна відповісти на наступні групи питань.
1. про необхідність вивчення даної зв'язку між ознаками та доцільності її практичного застосування;
2. про ступінь відмінностей тісноти зв'язку в її прояві для конкретних умов;
3. зіставляючи показники тісноти зв'язку результативної ознаки з різними факторами, можна виявити ті чинники, які в даних конкретних умовах є вирішальними.
До простих показниками тісноти зв'язку відноситься коефіцієнт кореляції знаків (коефіцієнт Г. Фехнера), заснований на оцінці ступеня узгодженості напрямків відхилень індивідуальних значень факторного та результативного ознак від відповідної середньої.
Якщо позначити - Число збігів знаків відхилень індивідуальних величин від середньої, - Кількість розбіжностей, тоді коефіцієнт Фехнера буде мати вигляд:

Якщо знаки всіх відхилень співпадуть то і - Свідчить про наявність прямого зв'язку, якщо всі знаки не збігаються, тоді і - Наявність зворотного зв'язку.
Розглянемо розрахунок на прикладі


партії
Середня зайнятість робочого місця
Середній час міжопераційного перерви, год, у
Знак відхилення від середньої
Збіг (а) або неспівпадання (в)
для х
для у
1
0,22
1,46
-
+
в
2
0,22
1,12
-
+
в
3
0,22
1,18
-
+
в
4
0,324
0,82
-
-
а
5
0,24
1,26
-
+
в
6
0,24
0,90
-
+
в
7
0,24
1,02
-
+
в
8
0,24
1,08
-
+
в
9
0,26
0,57
-
-
а
10
0,26
1,37
-
+
в
11
0,26
0,69
-
-
а
12
0,30
0,80
+
-
в
13
0,30
0,61
+
-
в
14
0,30
0,95
+
+
а
15
0,30
0,73
+
-
в
16
0,32
0,50
+
-
в
17
0,32
0,37
+
-
в
18
0,32
0,47
+
-
в
19
0,32
0,32
+
-
в
20
0,32
0,36
+
-
в
Разом
5,44
16,58
Одержуємо:
= 4, = 16,
Тоді
,
що свідчить від наявності
зворотній залежності.
При малому обсязі вихідної інформації коефіцієнт Фехнера відповідає також на питання про наявність зв'язку.
Більш сучасним показником ступеня тісноти зв'язку є лінійний коефіцієнт кореляції r.
При розрахунку цього показника враховується не тільки знаки відхилень індивідуальних значень від середньої, а й самі величини таких відхилень, тобто . Однак безпосередньо зіставити отримані абсолютні величини не можна, так як вони зазвичай виражаються в різних одиницях. Тому порівнянні можуть підлягати відхилення виражені у відносних величинах, звичайно в частках середнього квадратичного відхилення (нормовані відхилення).
Так для факторного ознаки ця величина буде дорівнює , А для результативного ;
Для того, щоб на основі зіставлення розрахованих нормованих відхилень отримати узагальнюючу характеристику ступеня тісноти зв'язку між ознаками розраховують середнє твір нормованих відхилень. Отримана таким чином середня і є лінійним коефіцієнтом кореляції r
;
перетворивши формулу:
;
Далі
.
Лінійний коефіцієнт приймає значення від - 1 до +1.
Чим ближче коефіцієнт r за абсолютною величиною до 1, тим тісніше кореляційний зв'язок. Позитивний знак r вказує на прямо пропорційну залежність, а негативний на назад. пропорційну залежність.
Для прикладу розрахуємо r




Отримана величина свідчить про досить тісному взаємозв'язку між розглянутими ознаками.
Квадрат лінійного коефіцієнта називається коефіцієнтом детермінації. Для прикладу Це означає, що варіації часу міжопераційних перерв пояснюється варіацією середньої зайнятості робочого місця виконаної однією операцією.
При дослідженні ступеня тісноти зв'язку між якісними ознаками, кожен з яких представлений у вигляді альтернативної ознаки, використовують коефіцієнт асоціації. Наприклад, потрібно оцінити чи впливають існуючі форми підвищення кваліфікації бухгалтерів на рівень їхньої професійної майстерності. Маючи дані про результати атестації експертами 320 бухгалтерів, з яких 240 підвищили кваліфікацію, складаємо наступну таблицю.
Групи викладачів
Середній бал у порівнянні з попереднім результатом атестації
Всього
Не змінився,
і виріс
Знизився
Підвищили кваліфікацію
163 (а)
77 (b)
240
Не минулі підвищення кваліфікації
43 (c)
34 (d)
80
Всього
209
111
320
Побудована в такій формі таблиця носить назву таблиці "чотирьох полів", частоти яких позначимо відповідно а, b, c, d /
Коефіцієнт асоціації визначаємо за формулою
.
У проведеному прикладі цей коефіцієнт дорівнює

Таким чином, за даними обстеження навряд чи можна зробити про істотне підвищення професійної майстерності по одній з прийнятих форм (стажування, курси, факультативи, творчу відпустку і т.д.).

4. Рівняння регресії і способи його розрахунку

Вивчення кореляційних залежностей грунтується на дослідженні таких зв'язків між змінними, при яких значення однієї змінної змінюються в залежності від того, які значення приймає інша змінна, розглянута як причина по відношенню до залежної змінної.
Визначаючи середні значення результативної ознаки для даної групи значень ознаки частково елімінується вплив випадковостей. Обчислюючи параметри теоретичної лінії зв'язку, проводиться їх подальше Елімінування і результатом є однозначне зміна Y зі зміною фактора Х.
Теоретичною лінією регресії називається та лінія, навколо якої групується точки кореляційного поля і яка вказує основний напрямок, основну тенденцію зв'язку.
Ця лінія повинна бути проведена так, що б сума відхилень точок поля кореляції від відповідної теоретичної лінії регресії дорівнювала нулю, а сума квадратів цих відхилень була б мінімальною величиною.
Важливим етапом регресійного аналізу є визначення типу функції, за допомогою якої характеризується залежність між ознаками. Найбільш часто для характеристики зв'язків економічних явищ використовують такі типи функцій:
лінійну ;
гіперболічний ;
параболічну ;
ступеневу
У розглянутому прикладі лінії регресії найбільше наближається до прямої і отже, теоретична лінія регресії може бути представлена ​​рівнянням прямої
;
Для знаходження параметрів чи b рівняння регресії використовуємо метод найменших квадратів.
Критерій методів найменших квадратів можна записати таким чином

т.к , То

Після перетворень з використовуємо похідних отримаємо систему рівнянь способу найменших квадратів для визначення параметрів чи b рівняння лінійної кореляційної зв'язку.

Використовуючи дані таблиць 3 і 4 можна записати систему рівнянь

Параметр b в рівнянні називають коефіцієнтом регресії. При наявності прямої кореляційної залежності коефіцієнт регресії має позитивне значення, а в разі зворотної - коефіцієнт регресії негативний.
Коефіцієнт регресії показує, наскільки в середньому зміниться величина результативного ознаки Y при зміні факторної ознаки Х на одиницю.
Знаючи лінійний коефіцієнт кореляції можна визначити коефіцієнт регресії b за наступною формулою
,
де , - Середньо квадратичне відхилення результативного і факторного ознак.
Наявність цього співвідношення дає можливість виробляти обчислення коефіцієнта кореляції і параметрів рівняння лінійної регресії одночасно.
Розрахунок показників по не згрупованим даними призводить до наступних результатів
= 0,0386, = 0,3461, r = - 0,812
тоді
і
і рівняння лінійної регресії прийме вигляд:
= 2,8091 - 7,28 х
коефіцієнт регресії застосовують для визначення коефіцієнта еластичності, який показує на скільки відсотків у середньому зміниться величина результативного ознаки Y при зміні ознаки - фактора Х на один відсоток.
Для визначення коефіцієнта еластичності використовується формула


Це означає, що при розрахунку середньої зайнятості робочого місця на 1% величина міжопераційних перерв знизиться на 2,389%.
Значення кореляційної залежності між двома змінними має істотне практичне значення, так як дає можливість скласти прогноз значень результуючого ознаки в припущенні, що ознака - фактор має певне значення.
Додати в блог або на сайт

Цей текст може містити помилки.

Математика | Контрольна робота
127.4кб. | скачати


Схожі роботи:
Статистичні методи вивчення взаємозв`язків фінансових показників діяльності банку
Статистичні методи вивчення взаємозв`язків виробничих показників фірми на прикладі продуктивності
Еволюція взаємозв язків людини
Культура і економіка пошуки взаємозв`язків
Діалектика взаємозв`язків цілей і рішень з прикладом
Статистичне вивчення рослинництва
Історичний аналіз зміни взаємозв`язків усередині особистості
Статистичні методи виявлення взаємозв`язків суспільних явищ
Статистичне вивчення складу населення
© Усі права захищені
написати до нас